|
Die technischen Möglichkeiten, Daten zu erfassen und dauerhaft zu
speichern, sind heute so ausgereift, dass insbesondere in
Unternehmen und anderen Organisationen große Datenbestände
verfügbar sind. In diesen Datenbeständen, häufig als Data
Warehouse bezeichnet, sind alle relevanten Informationen zu den
Organisationen selbst, den in ihnen ablaufenden Prozessen sowie
deren Interaktion mit anderen Organisationen enthalten. Vielfach
stellt die zielgerichtete Analyse der Datenbestände den
entscheidenden Erfolgsfaktor für Organisationen dar.
Zur Analyse der Daten in einem Data Warehouse sind verschiedenste
Ansätze verfügbar und erprobt. Zwei der wichtigsten Vertreter sind
das Online Analytical Processing (OLAP) und das Data Mining. Beide
setzen unterschiedliche Schwerpunkte und werden bisher in der Regel
weitgehend isoliert eingesetzt. In dieser Arbeit wird zunächst
gezeigt, dass eine umfassende Analyse der Datenbestände in einem
Data Warehouse nur durch den integrierten Einsatz beider
Analyseansätze erzielt werden kann. Einzelne Fragestellungen, die
sich aus diesem Integrationsbedarf ergeben werden ausführlich
diskutiert.
Zu den betrachteten Fragestellungen gehört die geeignete
Modellierung der Daten in einem Data Warehouse. Bei der Bewertung
gängiger Modellierungsansätze fließen insbesondere die
Anforderungen ein, die sich durch den beschriebenen
Integrationsansatz ergeben. Als Ergebnis wird ein konzeptuelles
Datenmodell vorgestellt, das Informationen in einer Weise
strukturiert, die für OLAP und Data Mining gleichermaßen geeignet
ist. Im Bereich der logischen Modellierung werden schließlich
diejenigen Schematypen identifiziert, die die Integration der
Analyseansätze geeignet unterstützen.
Im nächsten Schritt sind die für Data Mining und OLAP
unterschiedlichen Systemarchitekturen Gegenstand dieser Arbeit.
Deren umfassende Diskussion ergibt eine Reihe von Defiziten. Dies
führt schließlich zu einer erweiterten Systemarchitektur, die die
Schwachstellen beseitigt und die angestrebte Integration geeignet
unterstützt. Die erweiterte Systemarchitektur weist eine Komponente
zur anwendungsunabhängigen Optimierung unterschiedlicher
Analyseanwendungen auf. Ein dritter Schwerpunkt dieser Arbeit
besteht in der Identifikation geeigneter Optimierungsansätze
hierfür. Die Bewertung der Ansätze wird einerseits qualitativ
durchgeführt. Andererseits wird das Optimierungspotenzial der
einzelnen Ansätze auch auf der Grundlage umfangreicher Messreihen
gezeigt.
|